计算社会经济学:行为数据驱动预测性管理 | 周涛
电子科技大学周涛教授
大数据时代来临,经济和社会数据在人们不经意间就被大量记录。特别地,非干预的、高时空分辨率的行为数据,在预测性管理方面展露出很大的应用前景。本文整理自周涛教授在 AI&Society 第十三期上的演讲,完整视频见文末。
一 、行为规律性预测学习成绩
相比于高中,大学阶段有了更为宽松的学习环境。自由的氛围,本应有利于大学生培养个人兴趣,选择自己喜欢的发展方向。然而,宽松的环境很大程度上放任了大学生对自我管理的缺失。部分学生因为沉迷于网络游戏,终日无心课业,期末考试接连挂科。最终因无法完成学业,遗憾退学,自毁前程。
当教育管理者得知学生期末考试挂科的时候,其实就已经晚了。如果有心观察,沉迷游戏的学生,早在平时的行为就区别于其他学生。比如,他们可能晚出早归,经常逃课,在宿舍通宵玩游戏,总让室友帮忙带盒饭, 等等。如果能及时发觉学生的异常行为,就能提早采取干预措施,避免严重学业问题的出现。
相关论文:
Orderliness predicts academic performance: behavioural analysis on campus lifestyle
论文地址:
http://rsif.royalsocietypublishing.org/content/15/146/20180210
电子科技大学周涛团队的研究首次揭示校园生活的规律性和学生成绩的显著关联
不同于西方教育的理念里所推崇的自由氛围,东亚国家的教育文化对纪律性和规律性特别强调。父母更是从小告诉我们,要按时起床,要按时吃饭,要遵守课堂纪律。已有一些实证研究发现,课堂纪律与学生成绩显著相关。然而,行为的规律性与学习成绩的关系,还很少被大规模数据分析验证过。
基于近两万名大学生的校园刷卡记录数据,包括食堂吃饭、寝室洗澡、教学楼打水和图书馆进出4种行为约3000万条刷卡记录,可以构建出两类高阶的行为特征(有序性和努力程度),并与学习成绩形成关联。最终,利用机器学习算法,根据学生的行为特征预测他们的学习成绩。
图1:洗澡和吃饭规律性示意图。(a)中深蓝色代表前5%有规律的,浅蓝色是前5%没规律的。举例而言,(c)图是开始洗澡的时间在一天24小时中的分布,大家容易看到,某位有规律的同学主要在晚上21点左右洗澡,而没有规律的某位同学除了凌晨02:30到05:30,随时都可以去洗澡。| 图片来源:Y. Cao, et al., J. R. Soc. Interface 15 (2018) 20180210
有序性(Orderliness),衡量学生行为的规律程度。基于寝室洗澡和食堂吃饭的刷卡时间序列,使用真实熵(Actual Entropy)来计算。将行为时刻划分到一天内的48个区间内,行为越集中(熵越小)则有序性越大,行为越分散(熵越大)则有序性越小。如图中,深色曲线代表的学生,有序性更大。
将有序性作为重要特征引入机器学习模型,能够显著提高对成绩的预测能力。
图2:生活规律性和学业成绩正相关。横纵坐标是归一化后的生活规律性指数和GPA得分,都是减去平均值再除以标准差。可以看到,不管是吃饭还是洗澡,生活越规律,平均而言成绩越好。
努力程度(Diligence),通过教学楼打水和进出图书馆的次数来估计,记录数越多,努力程度越大。
图3 | 图片来源:Y. Cao, et al., J. R. Soc. Interface 15 (2018) 20180210
将有序性和努力程度与学习成绩关联起来,结果发现,有序性与学习成绩显著正相关。努力程度与学习成绩的关联性,稍微强于有序性与学习成绩的关联性。有序性与努力程度不显著相关,说明他们对学习成绩的独立解释能力。
二 、宗教的在线社交网络隔离
宗教信仰能够促进人类合作,提高公民参与,提升生活满意度,还能引领经济发展。不同宗教和文化团体,因内部倡导文化不同,会表现出不同的社会连接。
一般而言,越小众的亚文化团体,内部成员连接越紧密,更有利于获得团体成员的社会支持。宗教亦是如此。有些宗教可能比较包容,愿意跨宗教交流。也有些宗教可能相对保守,不太倾向于外部沟通。那么,宗教成员之间是怎样连接呢?
图片来源:J. Hu, et al., arXiv: 1802.06721, 2018
以关键词检索和人工核验的方式,研究者在新浪微博平台收集到6875个宗教信仰者账号,包含基督教、佛教、伊斯兰教和道教。分析这些宗教信仰者之间的社会网络,发现节点的出度和入度分布都有很强的异质性。而且,网络有非常清晰的社团结构,仅有1.6%的跨宗教连边。
这说明,宗教网络存在高度隔离的现象,宗教信仰者更倾向于跟同宗教信仰的人连接。这种隔离程度,远高于已知的种族和政治党派的隔离程度。
图表来源:J. Hu, et al., arXiv: 1802.06721, 2018
剔除掉规模效应的影响,将宗教信仰者之间连边的混合模式,与随机置乱模型下的情况做比较。结果发现,宗教信仰者仍然显著地倾向于与同宗教信仰者相连。其中,伊斯兰教和道教的同质性最为突出。佛教信仰者连接其他宗教信仰者的倾向性最大,这暗示佛教在中国的跨宗教交流中扮演重要角色。
慈善活动有助宗教间交流
宗教网络中仅有的一小部分跨宗教连边,为不同宗教信仰者架起沟通的桥梁,对维持宗教网络全局连通性非常重要。通过边渗流动力学,定量刻画跨宗教连边的重要程度。结果发现,跨宗教连边在维系网络联通性方面,比介数中心性、桥接性和节点度起到更显著的作用。
图表来源:J. Hu, et al., arXiv: 1802.06721, 2018
如此重要的跨宗教连边,是如何形成的,又包含哪些连接模式呢?
将跨宗教连边细分为四种类型,结果发现,具有被关注但不关注别人模式的节点(Type 3),其入度是平均水平的十倍以上。进一步分析这些宗教信仰者的账号信息,发现10%左右账号是慈善相关的团体。
在宗教网络中,绝大多数与慈善相关的节点都归属于佛教,这与佛教所倡导的包容和宽容非常契合。值得注意的是,与慈善相关的节点吸引了将近50%的跨宗教连边。这表明,慈善团体在促进宗教彼此交流方面有重要作用,慈善活动或将有助于增进宗教间的合作。
作者:高见
编辑:王怡蔺
推荐阅读
推荐课程
PC端观看地址:
https://campus.swarma.org/gcou=10643
集智俱乐部QQ群|877391004
商务合作及投稿转载|swarma@swarma.org
◆ ◆ ◆
搜索公众号:集智俱乐部
加入“没有围墙的研究所”
让苹果砸得更猛烈些吧!